home *** CD-ROM | disk | FTP | other *** search
/ PD ROM 1 / PD ROM Volume I - Macintosh Software from BMUG (1988).iso / Sounds / SpeechLib 3.0 / SpeechLib3.0 doc < prev   
Encoding:
Text File  |  1986-09-07  |  10.9 KB  |  211 lines  |  [TEXT/ttxt]

  1. SpeechLib 3.0 : a Microsoft BASIC Library
  2. for accessing MacinTalk
  3.  
  4. Program by: Kevin J. Willey
  5. MacDisk Librarian for Apple-Dayton®
  6.  
  7.  
  8.     SpeechLib is a Microsoft BASIC Library routine developed with the Macintosh 68000 Development System.  It was written using the guidelines in the Microsoft publication, "Microsoft BASIC for the Macintosh - Building Machine Language Libraries".  SpeechLib is used in conjunction with MacinTalk, the software speech synthesis resource developed by Apple Computer.
  9.  
  10.  
  11.     These are the icons for MacinTalk and SpeechLib.  Both of these resources must be accessible by the Microsoft BASIC Interpreter in order to use the speech synthesis capabilities of MacinTalk from within BASIC.  (Only BASIC versions 2.0 and higher are supported by SpeechLib.)
  12.  
  13.  
  14. USING SPEECHLIB:
  15.  
  16.     The Library routine has to be initialized before it can be accessed.  Therefore, the following line should appear in your program before any speech calls:
  17.  
  18.     LIBRARY "[Volume:]SpeechLib"    
  19.  
  20. the Volume name must be used if SpeechLib is on a disk other than the disk containing Microsoft BASIC.
  21.  
  22.     If BASIC cannot free enough memory to initialize the library, an "illegal function call" error will be generated.  Try changing the amount of memory allocated to the heap with the CLEAR command if this happens.  (The CLEAR command is documented on page 109 of the BASIC manual, also check the memory management section beginning on page 71.)
  23.  
  24.     Once BASIC has successfully opened the library, the SpeechLib routines can be used to access MacinTalk.  SpeechLib 3.0 fully supports all the existing capabilities of MacinTalk plus providing several other functions to make programming easier.
  25.  
  26.  
  27. SpeechLib Routines:
  28.  
  29.     The SpeechLib library is the interface between your BASIC program and MacinTalk.  The following BASIC commands will initiate various SpeechLib routines which will then access MacinTalk:
  30.  
  31. • CALL Speech (1[,"Exception File"] )
  32.     Loads the speech driver.  The "Exception File" parameter specifies an exception file created with the exception file editor distributed by Apple in the May software supplement.  If the "Exception File" parameter is omitted, MacinTalk will use its default English input pronunciation rules.  If "noReader" is used as the exception file parameter, MacinTalk will be limited to phonetic code input.  
  33.  
  34. • CALL Speech (2,"String to be spoken")
  35.     The default mode is English input, where the English text in "String to be spoken" is converted into a phoneme string which is then passed to MacinTalk for pronunciation.  If direct Phonetic input was specified by using 'noReader' as the exception file (see above), then "String to be spoken" must be a phoneme string to be passed directly to MacinTalk.
  36.  
  37. • CALL Speech (3)
  38.     Closes the speech driver.  It is important that this call be issued before ending your program, since it deallocates locked blocks of memory.
  39.  
  40. • CALL Speech (4, RATE)    ;(85 ≤ RATE ≤ 425)
  41.     Controls the number of words spoken per minute.  The allowable range is from 85 to 425 words/minute.
  42.  
  43. • CALL Speech (5, PITCH)    ;(65 ≤ PITCH ≤ 500)
  44.     Sets the baseline pitch in hertz for the speech waveform.  The baseline pitch is constrained to lie between 65 and 500 Hz.
  45.  
  46. • CALL Speech (6,MODE)    ;(0: Natural Voice   1: Robotic Voice)
  47.     Sets the "MODE" with which the speech will be generated.  The mode can be either 0 for "Natural" speech or 1 for "Robotic" voice.
  48.  
  49. • CALL Speech (7,SEX)*    ;(reserved for future use by Apple)
  50.  
  51. • CALL Speech (8,LANGUAGE)*    ;(reserved for future use by Apple)
  52.  
  53. • CALL Speech (9)
  54.     Resets all the Speech parameters to their default values.
  55.     {RATE:150  PITCH:110  MODE:Natural  SEX:Male}
  56.  
  57. • CALL Speech (10,"Text for Translation",Phoneme$)
  58.     This can only be used if English input is in effect.  "Text for Translation" is an English string.  Phoneme$ is a string variable which will contain the translated phoneme codes upon return.
  59.  
  60. • CALL Speech (11)
  61.     Provides spoken information about SpeechLib.
  62.  
  63.  
  64. *  These two routines are reserved by Apple for future use within MacinTalk.  They will not be functional until Apple "fleshes them out" in a future version of MacinTalk.
  65. Phonetic Input:
  66.     The MacinTalk driver produces speech from phonetic codes.  MacinTalk can translate English input into phonetic codes, but errors in translation cause the nuances of speech to become lost.  Optimal use of MacinTalk for fine tuning of speech is achieved by direct phonetic code input.  To fully understand the direct phonetic input capabilities, the user should be familiar with the MacinTalk v1.1 manual from Apple Computer.   This reproduction of the MacinTalk Phoneme Table is included for quick reference.
  67.  
  68.  
  69.     MACINTALK PHONEME TABLE
  70.     =============================
  71.             VOWELS
  72.     ---------------------------
  73.     IY    bEEt      IH    bIt
  74.     EH    bEt       AE    bAt
  75.     AA    hOt       AH    Under
  76.     AO    tAlk      UH    lOOk
  77.     ER    bIRd      OH    bOrder
  78.     AX    About     IX    solId
  79.     AX and IX should never be used in stressed syllables
  80.  
  81.             DIPHTHONGS
  82.     ---------------------------
  83.     EY    mAde      AY    hIde
  84.     OY    bOIl      AW    pOWer
  85.     OW    lOW       UW    crEW
  86.  
  87.             CONSONANTS
  88.     ---------------------------
  89.     R    Red        L    yeLLow
  90.     W    aWay       Y    Yellow
  91.     M    Men        N    meN
  92.     NX   siNG
  93.     S    Sail       SH   ruSH
  94.     F    Fed        TH   THin
  95.     Z    haS        ZH   pleaSure
  96.     V    Very       DH   THen
  97.     CH   CHeck      J    JuDGe
  98.     /H   Hole       /C   loCH
  99.     B    But        P    Put
  100.     D    Dog        T    Toy
  101.     G    Guest      K    Camp
  102.  
  103.         SPECIAL  SYMBOLS
  104.     ---------------------------
  105.     DX      piTy        (tongue flap)  
  106.     Q       kitt_en     (glottal stop)
  107.     RX      caR         (postvocalic R and L)
  108.     LX      caLL
  109.     QX                  silent vowel
  110.  
  111.     UL  =   AXL     IL  =   IXL     (contractions,  see text) 
  112.     UM  =   AXM     IM  =   IXM
  113.     UN  =   AXN     IN  =   IXN
  114.  
  115.  
  116.          Stress marks
  117.     --------------------------
  118.     Nouns               5
  119.     Pronouns            2
  120.     Verbs               4
  121.     Adjectives          5
  122.     Adverbs             7
  123.     Quantifiers         7
  124.     Exclamations        9
  125.     Articles            0   (no stress)
  126.     Prepositions        0
  127.     Conjunctions        0
  128.     Secondary stress    1, 2
  129.  
  130.     Punctuation
  131.     ---------------------------
  132.     .       sentence terminator
  133.     ?       sentence terminator
  134.     -       phrase delimiter
  135.     ,       clause delimiter
  136.     (   )   noun phrase delimiters
  137.  
  138.  
  139. Hints for usage:
  140.  
  141. • The Speech 1 and Speech 3 calls must be paired in order for your program to function correctly.  Before any speech commands can be issued, Speech 1 must be called and once speech is done, Speech 3 should be called to remove the code segments from memory.
  142.  
  143. -    If speech is used consistently throughout your program ,the speech driver should be installed  (Speech 1) at the beginning of the program and closed (Speech 3) only at the end.  (The speech driver must find an available block of memory each time it is installed.  If the heap becomes fragmented between installations of the speech driver, its possible that  loading will fail.)
  144.  
  145. -    If speech is used only in widely separated and selective parts of the program, then Speech 1 and Speech 3 calls should be used locally those areas.  (The speech driver takes up memory and remains resident until closed.)
  146.  
  147. • Both constants and variables can be used as arguments to the speech routines.  This leaves the programming options wide open:
  148.  
  149.        CALL Speech 2, (TextArray(2) + Name$)
  150.        etc...
  151.  
  152. • SpeechLib is written to accept any numeric size/type (e.g. single or double precision) as the input for the speech parameters.  The library will take care of converting the number to an integer for internal use.
  153.  
  154. • The use of a DEFINT statement has some side effects which must be taken into account:
  155.  
  156. If DEFINT a-z is used at the beginning of the program, you must remember to specify a larger numeric variable type for the library routine name, otherwise the program will crash.  (BASIC stores the address of the machine language routine in a variable with the same name as the library routine.  An integer variable can't hold a complete 32 bit address so the address is invalid.)
  157.  
  158.     DEFINT A-Z
  159.     Init=1
  160.     Call Speech# (Init)
  161.  
  162. • English conversion should only be used when the string to be spoken is not known in advance (e.g. keyboard input).  Direct phonetic input should be used as much as possible to insure maximum listener recognition.
  163.  
  164. • In those instances when English input and translation is used, two methods are available to correct mispronunciation.  A MacinTalk exception file can be created with the exception file editor from Apple or the English spelling can be adjusted to more accurately reflect the pronunciation. (e.g. "Willey" becomes "Why lee")
  165.  
  166. • To aid program readability and ease of programming, I recommend the following opening program assignments:
  167.  
  168.     Init=1: Say=2: Quit=3: Rate=4: Pitch=5: 
  169.  Mode=6: Defaults=9: Translate=10: Info=11: 
  170.  Natural=0: Robotic=1
  171.  
  172. • Using these assignments and the implied CALL structure (see the "SpeechLib" device.CALL statement in the BASIC manual for more information), you can access speech in a very straightforward manner:
  173.  
  174.     LIBRARY "SpeechLib"       this opens up SpeechLib for BASIC access
  175.  
  176.     A$="Translate This"       a variable assignment for a string
  177.  
  178.     Speech Init,"NewRulz"     initialize speech with the exception file "NewRulz"
  179.  
  180.     Speech Info               pronounces a 'canned' informational announcement
  181.  
  182.     Speech Rate,100        sets the speaking rate to 100 words/minute
  183.  
  184.     Speech Pitch,245          sets the speaking pitch to 245 hz.
  185.  
  186.     Speech Mode,Robotic       sets the speaking mode to Robotic
  187.  
  188.     Speech Say,"Hello"        pronounces the word 'Hello'
  189.  
  190.     Speech Defaults           resets all the speech parameters to their default 
  191.                         values (RATE:150  PITCH:110  MODE:Natural)
  192.  
  193.     Speech Say,A$             says the English string stored in A$
  194.  
  195.     Speech Translate A$,B$    takes the English string in A$ and returns the 
  196.                         Phonetic string in B$
  197.  
  198.     Speech Quit               closes the speech driver
  199.  
  200.     LIBRARY CLOSE             closes the link between BASIC and all libraries
  201.  
  202.  
  203. If you have any questions, problems or comments, please contact me:
  204.     Kevin J. Willey                       home phone: (513) 426-2329
  205.     4453 Stonecastle Dr. #1102
  206.     Dayton, OH 45440
  207.  
  208.     DELPHI : KWILLEY
  209.     GEnie : K.WILLEY
  210.  
  211.     This project would never have been completed were it not for the support and direct help of Jim Hopper and the entire Apple-Dayton User's Group in Dayton, Ohio.  If you plan on using SpeechLib in a commercial venture please contact me first.  If any of you are feeling generous, you can send me what you think this is worth, a few bucks, a blank disk, some of your source code, or just a few comments.  I promise in return to make every effort to support all worthwhile suggestions which come to my attention.  Future efforts will be directed at the adaptation of the SpeechLib interface into the BASIC "virtual device" format.  The PRINT# command could then be redirected to the